#import "@preview/touying:0.6.1": *
#import themes.aqua: *
#import "@preview/pinit:0.2.2": *

#show: aqua-theme.with(
  aspect-ratio: "16-9",
  config-info(
    title: [概率论],
    subtitle: [Subtitle],
    author: [数学主义],
    date: datetime.today(),
    institution: [Institution],
  ),
)
#set text(font: ("Calibri", "Microsoft YaHei"), weight: "regular", size: 25pt)

#title-slide()

#outline-slide()

= 二维离散随机变量

---
- #strong[一维随机变量] $X$ 描述的是一个随机试验结果的数值表示。

- 它的分布可以通过 #strong[分布列] 或 #strong[分布函数] 来刻画。

- 比如：掷一枚骰子，$X$ 表示点数，则
  $ P \( X = k \) = 1 / 6 \, quad k = 1 \, 2 \, dots.h \, 6 . $
  #strong[现在的问题是：如果一个实验中有两个随机结果是我们关心的呢？]

== 游戏抽卡系统
<游戏抽卡系统>
假设你在玩一款手游，每次抽卡获得一个角色。该角色有两个属性：

- $X$: 角色的稀有度等级（1至4星）

- $Y$: 技能强度等级（1至4级）

抽卡规则如下：

- 首先从 1 到 4 中等概率抽取一个等级 $X$（即
  $P \( X = i \) = 1 \/ 4$）；

- 然后根据 $X$ 的值，在 $1$ 到 $X$ 的范围内再等概率抽取技能强度 $Y$。

例如：如果你抽到了 3 星角色，那么技能强度只能是 1、2 或
3，且每种可能性相等。

#strong[抽到具有特定技能强度的特定稀有度角色的概率是多少？]

== 二维离散随机变量
<二维离散随机变量-1>
如果一个随机实验的结果可以用两个随机变量 $\( X \, Y \)$
来描述，并且它们只取有限个或可列个数对 $\( x_i \, y_j \)$，则称
$\( X \, Y \)$ 为 #strong[二维离散随机变量]。

- 类比：一维是单个数字，二维是"一对数字"；

- 如同坐标系中的点 $\( x \, y \)$，我们现在研究的是这些点出现的概率。

== 联合分布列
<联合分布列>
设 $\( X \, Y \)$ 是二维离散随机变量，令
$ p_(i j) = P \( X = x_i \, Y = y_j \) \, quad i \, j = 1 \, 2 \, dots.h $
称 ${ p_(i j) }$ 为 $\( X \, Y \)$ 的 #strong[联合分布列]。

- 这表示：#strong[同时]发生事件 $X = x_i$ 与事件 $Y = y_j$ 的概率；

- 可以用表格形式表示，称为 #strong[联合分布表]。

== 计算联合分布列
<计算联合分布列>

以刚才的抽卡系统为例：

- $P \( X = i \) = 1 / 4 \, quad i = 1 \, 2 \, 3 \, 4$

- 给定 $X = i$，$Y$ 在 ${ 1 \, 2 \, dots.h \, i }$ 上均匀分布，所以
  $ P \( Y = j divides X = i \) = cases(delim: "{", 1 / i \, & 1 lt.eq j lt.eq i, 0 \, & j > i) $

---
- 由乘法公式：
  $ P \( X = i \, Y = j \) &= P \( X = i \) dot.op P \( Y = j divides X = i \) \
  &= 1 / 4 dot.op 1 / i \, quad upright("当 ") 1 lt.eq j lt.eq i $
  否则为 0。

---

根据上面的计算，我们可以列出 $\( X \, Y \)$ 的联合分布表：


#figure(
  align(center)[#table(
    columns: 5,
    align: (auto,auto,auto,auto,auto,),
    table.header([X \\ Y], [1], [2], [3], [4],),
    table.hline(),
    [1], [1/4], [0], [0], [0],
    [2], [1/8], [1/8], [0], [0],
    [3], [1/12], [1/12], [1/12], [0],
    [4], [1/16], [1/16], [1/16], [1/16],
  )]
  , kind: table
  )

- 每个格子对应一个联合概率；

- 当 $j > i$
  时，$P \( X = i \, Y = j \) = 0$，因为技能强度不能超过稀有度。

== 联合分布列的基本性质
<联合分布列的基本性质>
设 ${ p_(i j) }$ 是二维离散随机变量 $\( X \, Y \)$ 的联合分布列，则：

+ #strong[非负性]：$p_(i j) gt.eq 0$, 对所有 $i \, j$；

+ #strong[正则性]：$sum_(i = 1)^oo sum_(j = 1)^oo p_(i j) = 1$。

- 类比一维：概率必须非负，总和为 1；

- 这里是双重求和，表示所有可能组合的概率之和为 1。

== 边际分布列（边缘分布律）
<边际分布列边缘分布律>
有时候我们只关心其中一个变量，比如只想知道角色的平均稀有度，而不关心技能强度。那么可以从联合分布中提取单个变量的信息。

在联合分布列 ${ p_(i j) }$ 中：
$ P \( X = x_i \) & = sum_(j = 1)^oo P \( X = x_i \, Y = y_j \) = sum_(j = 1)^oo p_(i j)\
P \( Y = y_j \) & = sum_(i = 1)^oo P \( X = x_i \, Y = y_j \) = sum_(i = 1)^oo p_(i j) $
分别称为 $X$ 和 $Y$ 的 #strong[边际分布列]。

- 就像"把表格按行或列加起来"；

- 是"忽略另一个变量"的结果。

== 计算边际分布列
<计算边际分布列>

#strong[\1. $X$ 的边际分布：]
$ P \( X = 1 \) & = 1 / 4 + 0 + 0 + 0 = 1 / 4\
P \( X = 2 \) & = 1 / 8 + 1 / 8 = 1 / 4\
P \( X = 3 \) & = 1 / 12 + 1 / 12 + 1 / 12 = 1 / 4\
P \( X = 4 \) & = 1 / 16 + 1 / 16 + 1 / 16 + 1 / 16 = 1 / 4 $ 

---

#strong[\2. $Y$ 的边际分布：]
$ P \( Y = 1 \) & = 1 / 4 + 1 / 8 + 1 / 12 + 1 / 16 = frac(12 + 6 + 4 + 3, 48) = 25 / 48\
P \( Y = 2 \) & = 0 + 1 / 8 + 1 / 12 + 1 / 16 = frac(6 + 4 + 3, 48) = 13 / 48\
P \( Y = 3 \) & = 0 + 0 + 1 / 12 + 1 / 16 = frac(4 + 3, 48) = 7 / 48\
P \( Y = 4 \) & = 0 + 0 + 0 + 1 / 16 = 3 / 48 = 1 / 16 $

== 注意
<注意>
边际分布可以从联合分布中"求和"得到，但 #strong[无法反推] 联合分布！

== 本节小结
<本节小结>
- 二维离散随机变量 $\( X \, Y \)$
  是同一样本空间上的两个离散随机变量的组合；

- 联合分布列 $P \( X = x_i \, Y = y_j \)$ 记录两个事件同时发生的概率；

- 联合分布列可用表格表示，满足非负性和总和为 1；

- 边际分布列通过"对另一变量求和"得到；

- 边际分布丢失了变量之间的依赖关系。

= 二维连续随机变量
== 外卖小哥的配送时间与距离
<外卖小哥的配送时间与距离>
假设某外卖平台记录每位骑手每次配送的：

- $X$: 配送距离（单位：km），连续变量；

- $Y$: 配送时间（单位：分钟），也连续。

我们关心的是：在某个区域内，配送时间和距离之间的关系。

#strong[没有分布列：]我们无法说
$P \( X = 2.5 \, Y = 15 \) > 0$，因为连续变量取具体值的概率为零！

#strong[我们需要新的工具：联合分布函数和联合密度函数。]

== 多维随机变量
<多维随机变量>
如果 $X_1 \( omega \) \, X_2 \( omega \) \, dots.h \, X_n \( omega \)$
是定义在同一样本空间 $Omega$ 上的 $n$ 个随机变量，则称
$ upright(bold(X)) \( omega \) = \( X_1 \( omega \) \, X_2 \( omega \) \, dots.h \, X_n \( omega \) \) $
为 #strong[n维随机变量] 或 #strong[随机向量]。

- 类比：一维是一个数，二维是一对数，三维是三元组……

- 样本点 $omega$ 对应一个"结果"，它被映射成一个向量。

== 联合分布函数
<联合分布函数>
设 $\( X \, Y \)$ 是二维随机变量。对任意实数 $x \, y$，称
$ F \( x \, y \) = P \( X lt.eq x \, Y lt.eq y \) $ 为 $\( X \, Y \)$ 的
#strong[联合分布函数]。

- 这是事件 ${ X lt.eq x }$ 与 ${ Y lt.eq y }$ 同时发生的概率；

- 类比一维：$F \( x \) = P \( X lt.eq x \)$；

- 几何意义：随机点 $\( X \, Y \)$ 落在以 $\( x \, y \)$
  为右上角、左下无限延伸的矩形区域内的概率。

---

#block[
图片隐身了

]
- 图中阴影区域：${ \( u \, v \) divides u lt.eq x \, v lt.eq y }$；

- $F \( x \, y \)$ 就是随机点 $\( X \, Y \)$ 落在这个区域的概率；

- 就像"地图上某区域的人口占比"。

== 联合分布函数的性质
<联合分布函数的性质>
$F \( x \, y \)$ 具有以下性质：

+ #strong[单调性]：对 $x_1 < x_2$，有
  $F \( x_1 \, y \) lt.eq F \( x_2 \, y \)$；对 $y_1 < y_2$，有
  $F \( x \, y_1 \) lt.eq F \( x \, y_2 \)$；

+ #strong[有界性]：$0 lt.eq F \( x \, y \) lt.eq 1$，且
  $ F \( - oo \, y \) = F \( x \, - oo \) = 0 \, quad F \( oo \, oo \) = 1 ; $

+ #strong[右连续性]：对每个变量都右连续，即
  $ F \( x + 0 \, y \) = F \( x \, y \) \, quad F \( x \, y + 0 \) = F \( x \, y \) ; $

+ #strong[非负性]：对任意 $a < b \, c < d$，
  $ P \( a < X lt.eq b \, c < Y lt.eq d \) = F \( b \, d \) - F \( a \, d \) - F \( b \, c \) + F \( a \, c \) gt.eq 0 . $

== 概率就是重量占比
<概率就是重量占比>
我们可以把联合分布函数看作平面上的特定区域的重量占比，那么：

+ #strong[单调性]：当 $x$ 增大时，区域变大，概率不能减少 →
  重量不会减少；

+ #strong[有界性]：重量占比不可能超过 $100 %$；

+ #strong[极限]：当 $x arrow.r - oo$ 时区域消失 → 面积趋于 $0$ →
  重量占比趋于 $0$；

+ #strong[极限]：当 $x arrow.r + oo$ 时铺满平面 → 重量占比趋于 $100 %$；

+ #strong[非负性]：四个角的差值对应一个矩形区域的概率，必须 $gt.eq 0$ →
  重量非负。

== 证明思路
<证明思路>
- #strong[单调性]：若 $x_1 < x_2$，则
  ${ X lt.eq x_1 \, Y lt.eq y } subset { X lt.eq x_2 \, Y lt.eq y }$，子集概率
  ≤ 全集概率 → 类似"小盒子装在大盒子里"；

- #strong[有界性]：$F \( - oo \, y \) = 0$ 因为 $X lt.eq - oo$
  不可能；$F \( oo \, oo \) = 1$ 是整个平面 → "全部可能性"；

- #strong[右连续性]：类似一维情况，划分后用可列可加性；

- #strong[非负性]：直接计算。

== 另一个想象

#strong[把 $F \( x \, y \)$ 看作一张"地形图"：]

- 每一点记录海拔高度，表示累积概率；

- 地图左下低，右上高，所以往右往上都是上升（单调性）；

- 最低点海拔为 $0$，最高点海拔为 $1$ （有界性）；

- 下来容易上去难（右连续）；

- 往右上方向走必定上升（非负性）。

== 联合密度函数
<联合密度函数>
如果存在二元非负函数 $p \( x \, y \)$，使得
$ F \( x \, y \) = integral_(- oo)^x integral_(- oo)^y p \( u \, v \) thin d v thin d u \, $
则称 $\( X \, Y \)$ 为 #strong[二维连续随机变量]，称 $p \( x \, y \)$
为它的 #strong[联合概率密度函数]。

- 类比一维：$F \( x \) = integral_(- oo)^x f \( t \) thin d t$；
- 密度函数 $p \( x \, y \)$ 描述"概率密度"在平面上的分布；
- 可以想象为"热力图"：越亮的地方，$\( X \, Y \)$ 越可能出现在那里。

== 联合密度函数的性质
<联合密度函数的性质>
联合密度函数 $p \( x \, y \)$ 满足：

+ #strong[非负性]：$p \( x \, y \) gt.eq 0$；

+ #strong[正则性]：$integral_(- oo)^oo integral_(- oo)^oo p \( x \, y \) thin d y thin d x = 1$；

+ 若 $G$ 是平面上的区域，则
  $ P \( \( X \, Y \) in G \) = integral.double_G p \( x \, y \) thin d x thin d y . $

---

- 类比一维：概率 = 积分；

- 在二维中，概率 = "密度函数在区域 $G$ 上的二重积分"；

- 注意："直线的面积为零" → 边界是否包含不影响结果。

== 如何理解"概率 = 积分"
<如何理解概率-积分>
- 用曲面代表 $p \( x \, y \)$，其"体积"就是总概率；

- 区域 $G$ 上方的"柱体体积"就是 $P \( \( X \, Y \) in G \)$；

- 所以：#strong[概率 = 密度函数在区域上的积分。]

== 离散 vs 连续
<离散-vs-连续>
#block[
#figure(
  align(center)[#table(
    columns: 2,
    align: (left,left,),
    table.header([#strong[离散型]], [#strong[连续型]],),
    table.hline(),
    [概率集中在点上], [概率分布在区域上],
    [用分布列 $p_(i j)$ 表示], [用密度函数 $p \( x \, y \)$ 表示],
    [$P \( X = x_i \, Y = y_j \)$
    有意义], [$P \( X = x \, Y = y \) = 0$],
    [概率 = 点上的数值], [概率 = 区域上的积分],
    [用表格], [用函数 + 积分],
  )]
  , kind: table
  )

]
== 课堂练习
<课堂练习>
设 $\( X \, Y \)$ 的联合密度函数为
$ p \( x \, y \) = cases(delim: "{", 2 \, & 0 lt.eq x lt.eq 1 \, med 0 lt.eq y lt.eq x, 0 \, & upright("其他")) $
求 $P \( X > 0.5 \, Y < 0.3 \)$。

---

#strong[解：]积分区域是 $0.5 < x lt.eq 1$, $0 lt.eq y < 0.3$，且
$y lt.eq x$，所以
$ P \( X > 0.5 \, Y < 0.3 \) = integral_0.5^1 integral_0^0.3 2 thin d y thin d x = integral_0.5^1 0.6 thin d x = 0.6 times 0.5 = 0.3 $

== 本节小结
<本节小结-1>
- 二维连续随机变量用联合分布函数 $F \( x \, y \)$ 描述；

- $F \( x \, y \)$ 是随机点落在左下无穷矩形区域的概率；

- 它满足单调、有界、右连续、非负四条性质；

- 若存在密度函数 $p \( x \, y \)$，则 $F \( x \, y \)$ 是其二重积分；

- 概率 = 密度在区域上的积分 → "概率 = 重量"。

= 蒲丰的抛针试验
== 起源
<起源>
#block[
#strong[一个用几何概率估算 $pi$ 的经典实验！]

]
- 蒲丰的奇思妙想（1777年）：假设地板上铺着等间距的平行木板，缝隙宽度为
  $d$。 现在你有一根长度为 $l$（$l lt.eq d$）的针，随意扔到地板上。

- #strong[问题：针与某条缝隙相交的概率是多少？]

== 数学建模
<数学建模>
我们需要两个随机变量来描述一根针落在地板上的位置：

- $X$：针的中点到最近一条缝隙的距离（$0 lt.eq X lt.eq d \/ 2$）；

- $Theta$：针与缝隙之间的夹角（$0 lt.eq Theta lt.eq pi \/ 2$，利用对称性）。

#strong[关键观察：]针会与缝隙相交，当且仅当
$ X lt.eq l / 2 sin Theta . $

== 建立概率模型
<建立概率模型>
我们假设：

- $X$ 在 $\[ 0 \, d \/ 2 \]$ 上均匀分布；

- $Theta$ 在 $\[ 0 \, pi \/ 2 \]$ 上均匀分布；

- $X$ 与 $Theta$ 相互独立。

== 联合密度函数
<联合密度函数-1>
因此 $\( X \, Theta \)$ 是二维连续随机变量，其联合密度函数为：
$ p \( x \, theta \) = cases(delim: "{", 2 / d dot.op 2 / pi = frac(4, pi d) \, & 0 lt.eq x lt.eq d / 2 \, med 0 lt.eq theta lt.eq pi / 2 \,, 0 \, & upright("其他") .) $

- 类比一维：均匀分布密度 = $1 \/ upright("区间长度")$；

- 二维独立 → 密度相乘；

- 总体积 =
  $integral_0^(d \/ 2) integral_0^(pi \/ 2) frac(4, pi d) thin d theta thin d x = 1$，符合要求。

== 计算相交概率
<计算相交概率>
事件（针与缝隙相交）：
$ A = {\( x \, theta \) divides x lt.eq l / 2 sin theta} $ 事件概率：
$ P \( A \) = integral.double_A p \( x \, theta \) thin d x thin d theta = integral_0^(pi \/ 2) integral_0^(l / 2 sin theta) frac(4, pi d) thin d x thin d theta $
---
先对 $x$ 积分：
$ = integral_0^(pi \/ 2) frac(4, pi d) dot.op l / 2 sin theta thin d theta = frac(2 l, pi d) integral_0^(pi \/ 2) sin theta thin d theta $
而$integral_0^(pi \/ 2) sin theta thin d theta = \[ - cos theta \] \|_0^(pi \/ 2) = 1$，所以
$ #box(stroke: black, inset: 3pt, [$ P \( upright("相交") \) = frac(2 l, pi d) $]) $

== 直观理解计算结果
<直观理解计算结果>
- 如果针很短（$l lt.double d$），概率很小；

- 如果针很长（接近 $d$），概率变大；

- 但为什么有 $pi$？因为角度 $theta$ 在四分之一的圆上均匀分布。

== 神奇推论
<神奇推论>
如果我们做 $n$ 次实验，其中有 $k$ 次相交，则
$ k / n approx frac(2 l, pi d) quad arrow.r.double quad pi approx frac(2 l n, d k) $
#strong[通过扔针，我们可以估算 $pi$ 的值！]

